AI012

การศึกษาเชิงลึกเกี่ยวกับโมเดลภาษาขนาดใหญ่

ตัวแทนอัตโนมัติ หลักการเรียนรู้เชิงเสริมจากข้อมูลมนุษย์ (RLHF) และการจัดสมดุลด้านความปลอดภัย

บทเรียน

บทเรียนที่ 8

ผู้สอน

ที่ปรึกษาด้านปัญญาประดิษฐ์

เป้าหมายการเรียนรู้

วิเคราะห์ องค์ประกอบทางสถาปัตยกรรมของตัวแทนแบบกราฟิก (GUI agents) รวมถึงโมดูลการวางแผน การตัดสินใจ และการสะท้อนกลับในระบบตัวแทนหลายตัว
อธิบาย กลไกของการเรียนรู้เชิงเสริม (RL) และการเรียนรู้เชิงเสริมจากข้อมูลมนุษย์ (RLHF) โดยเฉพาะบทบาทของโมเดลผลตอบแทน (reward models) และอัลกอริธึม PPO ในการจัดให้พฤติกรรมของตัวแทนสอดคล้องกับค่าทางสังคมของมนุษย์
ประเมิน ความเสี่ยงด้านความปลอดภัยและปัญหาด้านความน่าเชื่อถือของตัวแทนอัตโนมัติ รวมถึงข้อผิดพลาดที่เกิดจากการแจกแจงข้อมูลที่ไม่เคยเห็นมาก่อน (OOD errors) การโจมตีเพื่อหลุดพ้นจากข้อจำกัด (jailbreak attacks) และการรบกวนจากสภาพแวดล้อม